9.1. Каково соотношение ушедших и лояльных клиентов? Покажите это на графике и дайте комментарий по соотношению.

Соотношение классов(1 - класс ушедших, 0 - класс оставшихся) в датасете не сбаланансированное.

9.2. Постройте график, показывающий распределение баланса пользователей, у которых на счету больше 2 500 долларов. Опишите распределение и сделайте выводы.

Распределение сильно близко к нормальному. Наблюдения, которые лежат за пределами интервала (mean-3std, mean+3std), можно считать выбросами.

9.3. Посмотрите на распределение баланса клиента в разрезе признака оттока. Как различаются суммы на накопительном счёте ушедших и лояльных клиентов? Подумайте и напишите, с чем это может быть связано, что может не устраивать ушедших клиентов в банке.

Заметное различие в 25% квантили (медианна и 75% квантиль слабо различаются), а отсюда различие в межквартильном размахе. У покинувших банк клиентов основная сумма на считах заключенна в диапозоне 38000-130000 дол. Похоже, что банк покинули более состоятельные клиенты. Что их может не устраивать? Наверное низкие проценты.

9.4. Посмотрите на распределение возраста в разрезе признака оттока. В какой группе больше потенциальных выбросов? На какую возрастную категорию клиентов стоит обратить внимание банку?

В группе активных клиентов больше потенциальных выбросов. Банку стоит обратить внимание на возрастную группу > 55 лет

9.5. Постройте график, который показывает взаимосвязь кредитного рейтинга клиента и его предполагаемой зарплаты. Добавьте расцветку по признаку оттока клиентов. Какова взаимосвязь между признаками? Если не видите явной взаимосвязи, укажите это.

Явной связи между признаками не просматривается. Можно отметить, что все кто имел кредитный рейтинг < 400 покинули банк

9.6. Кто чаще уходит, мужчины или женщины? Постройте график, который иллюстрирует это.

Из диаграммы видно, что женщины уходили чаще.

9.7. Как отток клиентов зависит от числа приобретённых у банка услуг? Для ответа на этот вопрос постройте многоуровневую столбчатую диаграмму.

Из диаграммы видно, что чем больше количество продуктов банка используется, тем меньше отток клиентов. Правильней сказать - с увеличением числа услуг банка доля людей в общем количестве покинувших банк и пользовавшихся этим количеством услуг падает.

9.8. Как влияет наличие статуса активного клиента на отток клиентов? Постройте диаграмму, иллюстрирующую это. Что бы вы предложили банку, чтобы уменьшить отток клиентов среди неактивных?

Из диаграммы видно, что наличие активного статуса снижает вероятность покидания банка(неактивные покидают почти в два раза чаще). Можно посоветовать банку - разнообразить число продуктов.

9.9. В какой стране доля ушедших клиентов больше? Постройте тепловую картограмму, которая покажет это соотношение на карте мира. Предположите, с чем это может быть связано.

Наибольшая доля покинувших в Германии. Это может быть связанно с чем угодно. Например - из вопроса 9.4 было видно ,что покинувшие банк клиенты в среднем более состоятельные. Возможно, экономика Франции и Германии лучше чем Испании и число состоятельных людей больше чем в Испании и поэтому большая часть покинувших банк приходится на эти страны.

9.10. На основе полученной сводной таблицы постройте тепловую карту с аннотацией. Найдите на тепловой карте категории клиентов, которые уходят чаще всего.

Из тепловой карты видны категории которые уходят чаще. Вот пятерка первых: 1.Very_Poor_0, 2.Very_Poor_10, 3.Very_Poor_3, 4.Very_Poor_4, 5.Excellent_0. По кредитным категориям - в среднем чаще уходят две категори: Very_Poor и Excellent